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预测 未 来 的 交通 流 状 况 从 而 辅助 系统 中 的 任务 。 学 习 运 用 于 交通 流量 预测 领域 ,并 有 了 喧 关 的 成 效 。 代 表 
目前 ， 交 通 流 预测 模型 主要 可 以 分 为 三 类 ， 第 一 类 为 基 T E A 
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Application Research of Computers 
基于 门 控 循环 图 春 积 网 络 的 交通 沉 预 测 
Com x NDU, PX 
(1. 四 川 大 学 计算 机 学 院 , 成 都 610065; 2. 四 川中 电 启 明星 信息 技术 有 限 公司 , 成 都 610041) 
摘 要 : 交通 流 预测 在 智能 交通 系统 的 建设 中 起 着 关键 性 的 作用 ， 然 而 现 有 的 预测 方法 无 法 准确 的 挖掘 其 漆 在 的 时 


空 相关 性 ， 而 且 大 都 采用 全 连接 网 络 进行 单 步 预测 。 
提出 了 一 种 门 控 循 环 图 卷 积 网 络 (gated recurrent graph convolutional network，GR-GCN) 模 型 。 
卷 积 结合 门 探 循环 单 元 (GRU) 构 建 一 个 时 空 组 件 (Spatial-temporal component，STC) 以 同时 捕获 节点 的 时 空 相 关 性 ， 充 
分 的 提取 数据 的 时 空 特征 ; 然后 ， 利 用 该 时 空 组 件 构成 编码 器 单元 ， 并 将 时 间 序 列 数据 和 路 网 结构 数据 输入 其 中 ; 
最 后 ， 使 用 门 控 循 环 单元 作为 解码 器 单元 ， 并 按照 时 间 顺 序 将 两 者 组 成 一 个 编码 器 -解码 器 (Encoder-Decoder) 结 构 ， 
依次 解码 出 每 个 时 刻 的 预测 结果 。 在 加 利 福 尼 亚 交 通 局 (Caltrans) 性 能 评估 系统 中 高 速 公路 数据 集 PeMSD4 和 
PeMSD8 进行 了 实验 。 结 果 表 明 ， 所 提 模 型 GR-GCN 在 预测 未 来 15 分 钟 、30 分 钟 、45 分 钟 和 60 分 钟 的 交通 流量 
方面 优 于 大 多 数 现 有 基准 模型 ， 尤 其 是 在 长 期 预测 方面 。 

关键 词 : 交通 流量 预测 ， 图 卷 积 网 络 ， 门 控 循 环 单 元 ;编码 解码 结构 
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为 了 进一步 挖掘 数据 的 时 空 特性 以 及 提升 长 短期 预测 的 精度 ， 
首先 ， 利 用 频 域 上 的 图 


Traffic flow prediction based on gated recurrent graph convolutional network 


Wang Ming!, Peng Jian", Huang Feihu? ! 
(1. Sichuan University, College of Computer Science, Chengdu 610065, China; 2. Aostar Information Technologies Co, Ltd, 
Chengdu 610041, China) 


Abstract: Traffic flow prediction plays a key role in the construction of intelligent transportation systems. However, existing 
prediction methods cannot mine the potential spatiotemporal correlation in the data accurately, and most of them use fully 
connected networks for single-step prediction. In order to further mine the spatial-temporal features of the data and improve 
the accuracy of long-term and short-term prediction tasks, this paper proposed a Gated Recurrent Graph Convolutional 
Network (GR-GCN) . Firstly, by using spectral graph convolution combined with gated recurrent unit (GRU) to construct 
spatial-temporal components (STC) to capture the spatial-temporal correlation of nodes in the network, fully extract the 
spatial-temporal features of the data. Secondly, use STC as an encoder unit and enter the time sequence data together with 
road network data into it. Finally, using gated recurrent unit as a decoder unit, combine the two into an encoder-decoder 
network structure (Encoder-Decoder) in chronological order, and decode the prediction results at each moment in turn. 
Experiments were carried out on the highway datasets PeMSD4 and PeMSDS in the California Department of Transportation 
(Caltrans) performance evaluation system. The results show that model GR-GCN is better than most existing benchmark 
models in predicting the traffic flow in the future 15 minutes, 30 minutes, 45 minutes and 60 minutes, especially in long-term 
prediction. 
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Nearest Neighbor)、 支 持 疝 量 机 G1 等。 第 三 类 是 基于 深度 学 


习 到 数据 的 特征 和 相关 性 ， 还 能 
况 下 ， 从 简单 特征 中 挖掘 到 更 为 复杂 的 特征 。 
网 络 结构 ， 可 以 从 浅 层 信 ， 
Vict iain hid 
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9 能 交通 系统 叫 来 帮助 人 们 合理 规划 交通 
能 交通 系统 的 核心 在 于 准确 的 


习 的 方法 ， 也 是 目前 研究 的 主要 方向 ， 深 度 学 习 不 仅 可 以 学 
乍 不 进行 人 工 特征 工程 的 情 
通过 钱 加 神经 
居中 提取 特征 ， 对 解决 现实 生活 中 

。 上 目前， 许多 研究 者 们 已 经 将 深 


dod ds 主要 包含 历史 平均 分 析 预 测 法 、 自 
回归 差分 滑动 平均 法 向 (ARIMA) 和 卡尔 曼 滤 波 分 析 法 Bl]。 第 
学习 的 方法 ， 此 类 a 
线性 状态 ， 且 可 以 通过 上 自 适 应 学 习 不 断 调整 参数 至 最 优 ， 以 
此 获 炎 得 更 加 精确 的 计算 吉 果 ， 因 此 逐渐 取代 统计 理论 方法 。 

目前 用 于 预测 方面 的 主流 机 器 学 习 算 法 包 售 KNNIN(K- 
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合 了 ONN 与 LSTM 来 捕获 数据 的 时 空 相关 性 。Li Sg AU 
出 的 DCRNN 模型 利用 扩散 图 卷 积 对 空间 特征 进行 建 模 ， 并 以 
基于 GRU(Gated Recurrent Unit) 的 编码 解码 结构 对 时 则 维度 进 

ITE. Zhao 等 人 外 提出 了 的 T-GCN 模型 以 及 Yu 等 人 10 提出 
T 普 图 卷 积 来 捕获 节点 间 的 空间 依赖 关系 ,并 
利用 一 维 扩张 卷 积 对 时 间 特 征 进 行 建 模 。 这 些 模型 通过 建 模 
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数据 时 空 相关 性 来 对 交通 流 数 据 进行 预测 。 但 是 ， 以 上 方法 
要 么 没有 有 效 建 模 数据 的 时 空 相 关 性 ， 无 法 准确 的 捕获 数据 
的 时 空 特征 ， 要 么 融 是 使 用 单 步 预测 去 预测 未 来 几 个 时 间 步 
的 数据 ， 无 法 准确 体现 未 来 交通 流 数 据 的 时 序 关 系 中 |]。 

交通 流量 作为 一 种 典型 的 时 空 数 据 ， 在 预测 时 既 雷 要 考 
虑 道路 网 络 的 空间 依赖 性 ， 也 需要 考虑 历史 数据 以 及 未 来 数 
据 的 时 间 依 赖 性 。 单 独 考虑 时 间或 空间 依赖 ， 以 及 笼统 的 建 
模 未 来 预测 数据 之 间 的 关系 会 丢失 对 预测 结果 起 作用 的 重要 
信息 ， 为 解决 这 一 问题 ， 本 文 提出 了 门 控 循环 图 若 积 网 络 模 
型 (gated recurrent graph convolutional network, GR-GCN), 该 
模型 利用 频谱 域 上 的 图 卷 积 捕获 节点 间 的 空间 依赖 ， 并 将 种 
有 空间 关系 的 节点 输入 到 门 控 循 环 单元 中 同时 提取 交通 流 数 
据 的 时 空 特征 ,然后 通过 编码 解码 结构 对 数据 进行 多 步 预测 ， 
准确 的 建 模 了 历史 数据 间 以 及 未 来 预测 数据 间 的 依赖 关系 。 
在 真实 交通 流量 预测 数据 集 的 实验 结果 表明 本 模型 效果 优 于 
基准 模型 。 


1 ” 门 控 循 环 图 卷 积 网 络 


1.1 交通 流 预测 任务 

交通 流 预 测 任务 是 一 个 典型 的 时 间 序 列 预 测 任务 ， 本 文 
的 研 客 只 涉及 交通 流 数据 ， 因 此 只 用 保留 交通 状态 数据 中 的 
一 个 属性 ， 即 XeRw™ 。 交 通 流 预 测 问 题 是 根据 给 定 历史 观 
测 数 据 X — Gras Xa x) e RN 和 对 应 时 刻 的 路 网 结构 G ， 
其 中 元 为 历史 序列 输入 的 窗口 大 小 , 预测 未 来 古 时 段 所 有 市 
点 的 交通 流 数 据 YSE ， 其 中 
Yun, Uta Yan Van ER” 表示 在 未 来 工时 间 段 中 整个 交通 网 络 
的 流量 状态 。 简 而 言 之 ， 交 通 预 测 问题 的 本 质 是 学 习 一 个 函 
数 F ， 根 据 历史 观测 数据 和 对 应 的 路 网 结构 G ， 预 测 未 来 时 
段 古 内 所 有 市 点 的 交通 流 数 据 Y ， 具 体 的 公式 如 下 : 

ras Yuan) 7 FIO as Xir), G] (1) 

1.2 图 卷 积 网 络 

苍 积 神经 网 络 是 以 苍 积 操作 为 基础 的 前 馈 神 经 网 络 ， 可 
以 高 效 的 处 理 图 像 、 语 首 这 类 欧式 数据 。 但 是 实际 生活 中 有 
很 多 数据 都 是 非 欧 式 数 据 ， 这 类 数据 并 不 能 直接 使 用 卷 积 网 
络 直接 进行 特征 提取 ， 因 此 提出 了 图 苍 积 网 络 H%* 趾 ， 其 是 一 
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种 将 大 积 操作 扩展 到 图 结构 的 神经 网 络 ， 核 心思 想 是 中 心 市 
点 对 其 邻 域 节点 进行 信息 聚合 。 表 1 展示 了 进行 图 卷 积 操作 
涉及 的 一 些 符号 定义 。 
K1 图 相关 定义 
Tab. 1 The definition of graph 
Tu EX 
G 图 
E 图 中 边 集合 
V 图 中 市 点 的 集合 
A 图 的 节点 邻接 惩 阵 
D E] rp es B3 ERR RE 
L ELS LEE RIA E 
I 单位 矩阵 
HO 网 络 中 第 1 层 的 特征 


其 中 ， 邻 接 矩 阵 反 映 痢 图 中 节点 之 间 相 邻 天 系 ， 度 窍 阵 
有 反映 了 与 每 个 节 扣 相连 的 边 数 量 。 最 能 反映 图 结构 性 质 的 是 
图 的 拉 普 拉 斯 窍 阵 ,该 算 阵 是 图 研究 领域 中 的 核心 研究 对 象 ， 
描述 的 是 中 心 节 反 与 邻居 节 扩 信号 的 差异 ， 可 以 反映 市 点 邻 
域 的 平滑 性 ， 具 体 定义 为 


L-D-A (2) 
通 第 ， 正 则 化 的 拉 普 拉 斯 窍 阵 更 为 党 用， 定义 为 
I»" = DLD! —I-—-pD-2AD-? (3) 


GCN 柑 型 的 原理 是 利用 苍 积 本 质 上 是 频 域 上 的 滤波 这 
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一 特性 ， 在 频 域 上 进行 操作 0。 将 节点 特征 看 成 信号 ， 通 过 
傅 里 叶 变 换 到 频 域 空间 ， 最 后 通过 傅 里 叶 逆 变换 得 到 图 域 卷 
积 。 每 一 层 卷 积 仅 处 理 一 阶 邻 域 信息 ， 通 过 车 加 奎 干 卷 积 层 
可 以 实现 多 阶 邻 域 的 信息 传递 5。 每 一 个 卷 积 层 的 传播 规则 
如 下 : 


H 2g(I»»H 0W 0) (4) 

其 中 : c() 表 示 非 线性 激活 函数 。 简 而 言 之 ，GCN 的 每 一 层 
通过 邻接 年 阵 和 特征 矩阵 相 乘 得 到 每 个 项 点 邻居 特征 的 汇总 ， 
然后 再 乘 上 一 个 参数 滤 阵 ， 最 后 用 激活 函数 得 到 肾 合 邻居 节 
点 特征 的 矩阵 ,一 个 两 层 的 图 卷 积 网 络 模型 可 以 表示 为 如 下 : 

f(X,A)=o(AReLU(AXW, )W) (5) 
其 中 : x 表示 特征 矩阵 ，4 表示 拓扑 网 络 的 邻接 和 矩阵，A 表 
示 使 用 拉 普 拉 斯 正则 化 后 的 邻接 矩阵，W 和 W 分 别 为 第 一 
层 与 第 二 层 的 权重 参数 ，o(.) 和 ReLV() 表示 网 络 所 用 的 激活 
PR ZA. 
1.3” 门 控 循环 单元 

门 探 循环 单元 49 网 络 (GatedRecurrent Unit, GRU) 是 基于 
循环 神经 网 络 (RecurrentNeural Networks，RNN) 的 改进 模型 。 
相 比 于 RNN, 它 能 够 解决 长 期 记忆 和 反问 传播 中 的 梯度 消失 
等 问题 。 相 比 于 长 短期 记忆 网 络 (Long-Short Term Memory; 
LSTM), 使 用 GRU 能 够 与 其 达到 相当 的 效果 , 并 且 相 比 之 下 
更 容易 进行 训练 ， 能 够 很 大 程度 上 提高 训练 效率 。 

GRU 中 的 隐藏 单元 是 一 个 特殊 的 细胞 结构 而 不 是 传统 
神经 网 络 的 节点 。 在 其 内 部 有 两 个 门 控 ， 即 一 个 重 置 门 (reset 
gate) 和 一 个 更 新 门 (update gate)。 直 观 上 说 ， 重 置 门 决定 了 如 
何 将 新 的 输入 信息 与 前 面 的 记忆 相 结 合 ， 更 新 门 决定 了 前 面 
记忆 保存 到 当前 时 间 步 的 量 。GRU 的 细胞 结构 如 图 1 所 示 。 


图 1 GRU 单元 结构 
Fig. 1 The inner structure of GRU 
各 个 门 控 的 计算 公式 如 下 : 


z -o(x,U* *s, W*) 
r -o(x,U' *s, IW") 
h = tanh(x,U^ (s, Or W^) Á 
s, =(1-z7)Oh+z0S, 


其 中 : 符号 "O" 表示 两 个 向 量 对 应 位 置 上 的 元 素 相 乘 ; o 表示 
sigmoid 激活 函数 ; “代表 更 新 门 ; r 代表 重 置 门 ;， 天 代表 当 
前 记忆 内 容 ，s, 代表 当前 时 间 步 的 最 终 记 忆 。 由 于 其 具有 循 
环 结构 ， 上 一 个 细胞 的 最 终 记 忆 和 当前 时 间 步 的 输入 一 起 作 
为 当前 细胞 的 输入 。 通 过 串联 这 些 单元 结构 ， 并 将 数据 按照 
时 间 顺 序 输入 到 这 些 单元 中 ， 经 过 这 些 单元 的 运作 和 学 习 ， 
即 能 捕捉 到 数据 中 潜在 的 时 间 相 关 性 。 
1.4 编码 解码 结构 

编码 右 - 解 码 器 模型 (Seq2Seq) 最 初 是 用 于 机 堪 翻 译 领 域 
的 一 种 很 成 功 的 结构 上。 这 种 模型 接受 一 个 序列 作为 输入 ， 
并 将 序列 中 的 信息 编码 为 中 间 表 示 ， 最 后 使 用 解码 器 解码 中 


间 表 示 依 次 解码 为 目标 序列 ， 由 于 使 用 解码 器 来 预测 部 分 ， 
预测 结果 一 般 不 可 知 ， 往 往 需 要 将 前 一 时 刻 的 预测 结果 和 编 
人 码 的 隐藏 表示 一 起 作为 下 一 时 刻 的 输入 。 如 图 2 所 示 。 
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图 2 编码 器 解码 器 结构 
Fig.2 The structure of Encoder-Decoder 
这 类 结构 具有 很 强 的 变通 性 ， 其 编码 器 和 解码 器 可 以 是 
不 同类 型 的 结构 ， 在 现 有 的 研究 中 ， 编 码 右 可 以 为 


RNN(recurrent neural network), GRU(gated recurrent units). 


LSTM(long short term memory). GCN(graph convolutional 
network) BV zr b] Tyt xx EX (spatial-temporal attention block) 的 任 
意 组 合 ,同时 解码 器 可 以 为 RNN、GRU、LSTM 或 者 多 层 感 知 
机 的 任意 组 合 %» 站 。 只 用 满足 如 下 映射 天 系 : 
X -[X,,--, X AY -|[Y,.---.Y,] (7) 

其 中 : ?与 4 分 别 为 编码 器 和 解码 器 的 长 度 。 这 两 者 可 以 不 
相等 ， 因 此 可 以 将 其 应 用 于 交通 预测 任务 中 ， 对 数据 进行 多 
步 预 测 。 具 体 来 说 ， 编 码 器 将 历史 序列 编码 为 一 个 隐藏 中 间 
表示 C， 然 后 将 中 间 隐 藏 表示 C 输入 到 解码 层 使 其 解码 成 为 
未 来 的 交通 状态 。 
1.5 门 控 循环 图 卷 积 网 络 模 型 

为 了 同时 捕获 交通 流 数 据 的 空间 和 时 间 的 相关 性 ， 本 文 
其 于 图 卷 积 网 络 、 门 控 融 合 单 元 以 及 编码 莫 解 码 右 提出 了 一 
个 门 控 循 环 图 神经 网 络 模 型 ， 如 图 3 所 示 。 
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图 3 GR-GCN 整体 模型 结构 图 
Fig.3 The overall architecture of GR-GCN 

图 3 mE BEA ST AS. EDI SEE PUR TERES f] 
A AGUA N 8 A i8 RI e ro ns KRR ERAN 
时 间 图 卷 积 单元 。 单 元 运作 过 程 如 下 ， 首 先 ， 单 元 中 的 图 卷 
只 网 络 被 用 来 捕获 交通 拓扑 路 网 的 结构 并 得 到 其 空间 特征 。 
然后 ,将 市 有 空间 信息 的 时 间 序 列 数据 输入 到 门 控 循 环 蛙 元 ， 
音 妨 在 这 些 单 元 中 动态 变化 来 得 到 序列 数据 的 时 间 特 征 。 当 
整个 历史 序列 输入 完 并 处 理 完成 后 ， 最 后 一 个 单元 的 输出 即 

为 中 间 表 示 C。 编 码 右 的 过 程 如 下 : 
H, = GRU[GC(x;), H] (8) 

C=H,S,=H, 
Ep: HQESSM,A x 相关 联 的 隐藏 表示 ， 防 是 随机 初始 化 

的 非 零 矩阵 。 

图 3 的 右 半 部 分 属于 解码 器 ， 解 码 器 则 使 用 GRU 单元 
对 中 间 表 示 € 进行 解码 ， 解 码 后 得 到 隐藏 表示 。 通 过 一 个 前 
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馈 神 经 网 络 对 未 来 某 个 时 间 步 的 数据 进行 预测 。 各 个 时 间 步 
的 隐藏 状态 及 预测 值 交 的 具体 计算 方式 如 下 : 
S$,=GRU(C,Y,1,S ,1) 

$=SW (9) 
其 中 : 5; 是 与 输出 3》 相关 联 的 隐 世 表示, 并 且 六 是 输出 序列 
的 开始 ， 属 于 一 个 序列 的 初始 信号 ， 需 要 进行 初始 化 ， 在 模 
型 中 使 用 上 一 个 时 间 步 的 流量 特征 对 其 进行 初始 化 ， 便 于 解 
码 器 的 迭代 。 

对 于 时 空 建 模 单 元 (TGCN)， 其 内 部 结构 如 图 4 所 示 。 


图 4 时 间 图 卷 积 单元 处 理 过 程 
Fig.4 The process of temporal graph convolution unit 


图 中 ,si 表示 在 1-1 时 刻 的 输出 ，GC 代表 图 卷 积 处 理 过 


Fé. n 与 2 分 别 代表 在 上 时 刻 的 重 置 门 与 更 新 门 ，8 表示 在 : 
时 刻 的 输出 ，y, 表示 s, 经 过 全 连接 层 变换 的 输出 。 有 具体 的 计 
算 过 程 如 下 : 
z, =o(W’:[f(A,x,),s,1]+5b.,) 
r, =o(W’[f (A,x,),s,1]+b,) (10) 
h, = tanh(W ^[ f (A, x,), (s, , Or,)] - b,) 
s, -(1-z)Oh, +z, OS, 


其 中 : f(4,x) 表示 图 吞 积 的 处 理 过 程 ， 计算 方式 如 式 (5)，W 
FI b 表示 训练 过 程 中 的 权重 系数 与 偏转 。 

解码 过 程 与 编码 过 程 类 似 ， 由 于 在 解码 过 程 中 ， 输 入 数 
据 已 经 经 过 编码 絮 中 的 图 苍 积 进行 了 空间 依赖 性 捕获 ， 则 不 
需要 再 对 其 进行 图 卷 积 操作 了。 因此， 在 解码 莫 部 分 ， 本 文 
仅 使 用 GRU 对 中 间 变 量 进行 解码 ， 解 码 方式 如 式 (6)。 

忆 的 来 说 ， 时 空 图 疮 积 网 络 模 型 能 够 处 理 交 通 数 据 中 复 
末 的 空间 依赖 性 和 动态 的 时 间 依 赖 性 。 一 方面 ， 图 巷 积 网 络 
秘 用 来 捕获 交通 城市 网 络 拓扑 结构 中 市 点 之 间 的 空间 依赖 天 
系 。 男 一 方面 ， 门 控 循环 单元 被 用 来 捕获 交通 道路 上 信息 的 
动态 变化 以 得 到 市 点 目 映 的 时 间 依 赖 性 。 最 后 使 用 编码 费解 
码 器 (Seq2Seq) 结 构 完成 对 交通 流 的 多 步 预 测 。 通过 以 上 模块 
的 有 效 结合 ， 很 好 的 建 模 了 交通 流 的 空间 和 时 间 方 面 的 依赖 
性 ， 并 完成 预测 任务 。 


2 实验 结果 与 分 析 


2.1 数据 集 

本 文 利 用 两 个 真实 的 高 速 公 路 数据 集 PeMSD4 和 
PeMSDS 进行 实验 。 使 用 其 中 的 车 流量 数据 作为 实验 数据 集 ， 
使 用 采集 频率 为 30 秒 / 次 的 原始 数据 汇总 成 时 间 间 隔 为 5 分 
钟 的 数据 样本 ， 即 每 个 点 一 个 小 时 包含 12 个 交通 数据 样本 。 

本 文 使 用 过 去 一 个 小 时 的 流量 数据 (12 个 监测 样本 ) 去 预 
测 未 来 15 分 钟 (3 个 样本 )、30 分 钟 (6 个 样本 )、45 分 钟 (9 个 
样本 ) 和 60 分钟 (12 个 样本 ) 的 流量 数据 ， 并 按照 7:1:2 的 比 
例 将 数据 集 划 分 成 为 训练 集 、 验 证 集 和 测试 集 ， 并 且 利 用 训 
练 集 的 均值 和 方差 对 划分 后 的 三 个 数据 集 进行 归 一 化 处 理 ， 
数据 的 详细 信息 可 见 表 2。 
2.2 对比 模型 和 评价 指标 

实验 通过 两 个 回归 任务 常用 的 指标 来 评估 模型 的 性 能 ， 
分 别 为 平均 绝对 误差 (Mean Absolute Error，MAE) 均 方 根 误差 
(Root Mean Squared Error，RMSE)， 具 体 的 计算 公式 为 


1% z 
MAE == X - Ti (11) 
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nMsE- | S08 (12) 
m m 


本 文选 择 结合 了 MSE fll MAE 的 Huber 作为 损失 函数 ， 
通过 调节 超 参 数 来 确定 MAE 和 MSE 的 作用 范围 , 能 够 使 得 
模型 尽快 收敛 到 全 局 最 优 解 ， 具 体 的 计算 公式 为 

| 50-9 yb- 
Ls(Y,Y)= 1 (13) 
álY -Y|- —ó others 
2 
42 数据 集 描述 
Tab.2 The description of data sets 
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图 5 反映 了 在 PeMSD4 5j PeMSDS 数据 集 下 随 看 隐 苦 单 
元 数量 的 变化 ， 平 均 绝 对 误差 MAE 和 均 方 误差 RMSE 的 大 
小 。 可 以 观察 到 ， 随 着 隐藏 单元 数量 增 大 ， 误 大 是 先 增 大 后 
减 小 的 。 当 隐藏 单元 数量 为 64 时 ， 模 型 的 预测 误差 最 小 。 主 
要 是 因为 当 隐藏 单元 逐渐 增 大 到 一 定 的 值 后 ， 模 型 的 复杂 度 
以 及 计算 复杂 上 度 会 呈 指 数 型 增 大 ， 因 此 ， 本 文 在 整个 实验 过 
程 中 ， 将 隐 蕊 层 数 均 设 置 为 64. 
实验 及 结果 分 析 
K 3 展示 了 本 文 模型 和 基准 模型 在 PeeMSD4 和 PeMSD8 
数据 集 上 预测 15 分钟 、30 分 钟 、45 分 钟 与 60 分 钟 时 交通 
流量 预测 的 误差 表现 。 
表 3 各 个 模型 在 不 同 预测 范围 上 的 误差 表现 
Tab.3 The performance of proposed model and 
baselines on PeMSD4 and PeMSDS8 


15min 30min 45min 60min 


MAE RMSE MAE RMSE MAE RMSE MAE RMSE 


Data Method 


数据 集 PeMSD4 PeMSD8 
传感器 数量 307 170 
时 间 范 围 1/1/2018 — 2/28/2018 7/1/2016 — 8/31/2016 
样本 间隔 5 分 钟 
训练 样本 数 11877 12482 
验证 样本 数 1696 1783 
测试 样本 数 3392 3566 
为 了 验证 本 文 提出 模型 的 有 效 性 ， 设 置 了 7 种 基准 方法 
进行 实验 对 比 。 


HA: 历史 平均 模型 。HA 模型 直接 使 用 平均 值 作为 预测 结 
果 ， 本 文 使 用 12 个 历史 时 间 片 的 平均 值 来 预测 未 来 若干 个 值 。 

ARIMAP!; 上 自 回 归 差 分 滑动 平均 模型 ARIMA 模型 时 应 
用 较为 广泛 的 时 间 序 列 分 析 模 型 。 

GCNP?I. 图 卷 积 网 络 。 将 时 间 维 度 作为 图 中 节点 的 特征 ， 
最 后 使 用 全 连接 进行 预测 任务 。 

GRUU9; 门 控 循环 单元 网 络 。 GRU 是 一 种 特殊 的 循环 神 
经 网 络 模型 ， 实 验 中 使 用 一 层 GRU 和 一 层 全 连接 的 模型 组 合 。 

T-GCNP, 时 间 图 卷 积 网 络 。T-GCN 将 图 卷 积 集成 与 循 
环 神 经 网 络 单元 中 ， 并 用 一 层 全 连接 的 模型 进行 预测 。 

DCRNNP/!; 扩散 图 卷 积 循环 网 络 。 这 是 一 个 基于 GNN 
和 RNN 的 模型 ， 它 集成 了 GRU 和 双向 扩散 卷 积 用 于 预测 。 

AGCRN!?!, 自 适 应 图 车 积 循环 网 络 。 它 采用 目 适 应 图 并 
将 GRU 与 图 卷 积 与 节点 自 适 应 参数 学 习 相 结合 ， 并 使 用 全 
连接 进行 预测 。 
23 ”实验 超 参 设置 与 分 析 

本 文 模型 GR-GCN 主要 涉及 的 超 参 数 包括 学 习 率 
(learning rate)、 训 | 练 轮 数 (epoch)、 批 大 小 (batch size) 和 隐藏 层 
数量 。 本 文 设置 学 习 率 为 0.001, batch 大 小 设置 为 64、 训 练 
轮 数 设置 为 200 轮 。 

神经 网 络 隐 藏 单元 的 数量 是 本 文 模型 重要 的 一 个 参数 ， 
不 同 的 隐藏 单元 的 数量 会 很 大 程度 的 影响 模型 的 预测 精度 。 
为 了 能 够 选择 出 最 适合 的 值 ， 本 文 设计 了 相关 实验 。 

在 PeMSDA 数据 集 上 , 隐藏 单元 数量 分 别 设置 为 8、16、 
32. 64 与 128 并 且 分 析 了 预测 误差 的 变化 。 如 图 5 所 示 ， 横 
坐标 表示 隐藏 单元 的 数量 ， 纵 坐标 表示 预测 误差 。 
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图 5 在 不 同 隐藏 单元 数量 下 模型 的 预测 误差 
Fig.3 The prediction error of proposed model under 


different number of hidden units 


HA 28.22 41.93 31.59 46.82 34.95 51.78 38.29 56.76 
ARIMA 24.36 43.47 30.59 58.30 37.62 67.86 44.31 74.89 
GCN 24.66 36.16 26.24 39.92 28.9] 45.66 31.70 50.12 
GRU 23.36 33.84 24.58 37.81 26.64 40.15 28.55 42.53 
PeMSDA 
T-GCN 21.01 31.94 23.90 34.69 26.69 37.09 30.29 40.28 
DCRNN 20.45 30.65 22.43 32.67 24.89 34.90 26.54 36.98 
AGCRN 19.83 29.85 21.46 31.81 23.74 33.45 25.04 35.16 
GR-GCN 20.81 30.97 21.97 32.11 23.10 33.09 24.54 34.41 
HA 23.08 34.26 26.05 38.66 29.02 43.08 31.97 47.49 
ARIMA 18.25 29.58 22.96 39.6] 28.16 50.03 33.87 60.15 
GCN 19.87 28.34 21.41 34.77 23.57 39.96 24.87 44.40 
GRU 16.62 24.6] 19.32 29.74 21.18 32.11 23.07 35.71 
PeMSDS 
T-GCN 17.83 25.53 18.09 27.36 20.14 29.96 21.18 31.47 
DCRNN 16.36 24.02 17.25 26.61 18.38 27.35 19.63 28.56 
AGCRN 15.56 22.86 16.72 24.42 17.31 25.80 18.22 27.19 
GR-GCN 15.26 23.31 16.29 24.01 16.68 25.12 17.82 26.34 
从 上 表 可 以 看 出 ， 就 两 个 评估 指标 而 言 ， 本 章 提 出 的 模 
型 在 两 个 数据 集 上 都 接近 最 佳 表现 。 本 节 将 从 三 个 方面 来 分 
析 了 模型 GR-GCN 的 优势 。 
首先 是 拥有 低 误 差 优 势 ,可 以 发 现 ,一 些 基 于 神经 网 络 ， 
并 且 充 分 考虑 时 间 特 征 建 模 重要 性 的 模型 ， 包 括 GR-GCN. 
T-GCN 以 及 GRU， 普 裔 在 预测 精度 方面 会 高 于 其 他 像 HA、 
ARIMA 这 类 基于 统计 理论 的 预测 模型 。 以 数据 集 PeMSD4 
上 对 于 提前 15 分 钟 的 预测 任务 为 例 ，GR-GCN 和 工 GCN 的 
均 方 误差 比 HA 的 均 方 误差 分 别 低 了 27.5% 和 14.1%， 比 
ARIMA 的 均 方 误差 分 别 低 了 30.0% 和 17.1%。 这 是 因为 像 
HA, ARIMA 这 类 模型 无 法 处 理 时 间 序 列 这 种 复杂 、 非 线性 
的 数据 。 而 GCN 之 所 以 具有 很 高 的 误差 是 由 于 GCN 只 考虑 
了 空间 特性 而 忽略 了 交通 数据 是 一 个 典型 的 时 间 序 列 数据 。 
除 此 之 外 ,ARIMA 作为 一 个 比较 成 熟 的 时 间 序 列 预测 模型 ， 
预测 的 准确 性 比 HA 模型 更 低 的 原因 在 于 其 难于 处 理 长 时 以 
及 非 平 稳 的 序列 数据 ， 并 且 在 计算 误差 时 使 用 的 是 总 体 误 差 
的 一 个 平均 值 ， 如 果 某 个 节点 数据 波动 较 大 ， 则 使 得 最 终 的 
预测 效果 变 差 。 
接着 是 模型 的 时 空 预测 能 力 优 势 ， 为 了 验证 模型 时 空 预 
测 方面 的 优势 , 本 文 对 比 了 GCN 和 GRU 这 种 神经 网 络 模型 。 
从 图 6 可 以 清晰 的 看 到 基于 时 空 特征 的 模型 (GR-GCN) 比 基 
于 单个 特征 (GCN、GRU) 进 行 预测 效果 要 更 好 ， 以 数据 集 上 
PeMSD4 上 对 于 提前 15min 的 预测 任务 为 例 ，GR-GCN 的 均 
方 误差 相 比 GCN 的 均 方 误差 低 了 32.5%， 比 GRU 的 均 方 误 
ZAR f 11%. 说 明 GR-GCN 模型 能 够 很 好 的 捕获 数据 中 的 时 
间 和 空间 相关 性 
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(a) GCN 与 GR-GCN 误差 对 比 。 (b) GRU 5 GR-GCN 误差 对 比 
图 6 GCN 和 GRU 与 GR-GCN 误差 对 比 图 
Fig.6 The error comparison among GCN, GRU and GR-GCN 
最 后 就 是 对 长 时 预测 能 力 优 势 。 为 了 更 直观 的 说 明 此 方 
面 的 优势 ， 绘 制 了 根据 预测 步 长 的 变化 ， 预 测 误差 变化 趋势 
图 ， 如 图 7 与 图 8 所 示 。 从 图 中 可 以 看 出 ， 随 看 预测 步 数 的 
增 大 , 其 他 基准 模型 的 均 方 误差 比 本 文 模型 GR-GCN 增长 速 
EER, 例如 ， 在 PeMSD4 上 预测 单个 时 间 步 时 ，T-GCN 与 
GRU 的 预测 误差 跟 GR-GCN 基本 持平 , 但 是 在 预测 12 个 时 
间 步 时 ， 差 距 明 显 增 大 ，GR-GCN 比 同样 为 时 空 预测 模型 的 
T-GCN 误差 小 了 11.1%。 除 此 之 外 ， 相 较 于 一 些 在 短期 预测 
上 比较 与 优秀 的 模型 ， 如 DCRNN 和 AGCRN， 本 文 所 提 模 
型 在 短期 预测 方面 (小 于 30min) 有 所 不 足 ， 均 方 误 差 比 
AGCRN 大 约 高 了 3%-5%。 但 是 ， 在 长 期 预测 方面 ， 本 文 模 
型 GR-GCN 得 益 于 其 编码 -解码 的 预测 结构 ， 较 这 两 者 模型 
表现 略 好 ，GR-GCN 在 预测 60min 时 比 AGCRN 的 均 方 误差 
小 了 3.1%。 这 证 明了 模型 的 编码 器 -解码 器 架构 的 加 入 ， 对 
数据 的 长 期 预测 时 有 一 定 效果 的 。 
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图 7 不 同方 法 在 PeMSD4 上 的 预测 的 均 方 误差 趋势 
Fig.7 The RMSE trend on pemsd4 by different methods 
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图 8 不 同方 法 在 PeMSD8 上 的 预测 的 均 方 误差 趋势 
Fig.8 The RMSE trend on pemsd8 by different methods 
为 了 能 更 好 的 理解 GR-GCN 模型 的 预测 效果 , 在 实验 结 
RAW, KLE PeMSD4 上 随机 选择 了 两 个 不 同 的 路 段 ， 对 
这 两 个 路 段 提前 15 分 钟 和 提前 60 分 钟 的 交通 流量 预测 情况 
进行 可 视 化 ， 对 比 预测 值 与 真实 值 之 间 的 差距 ， 如 图 9 和 10 
所 示 。 其 中 灰色 虚线 代表 真实 的 数据 ， 绿 色 曲 线 代 表 提 前 15 
分 钟 的 预测 结果 ， 红 色 曲 线 代 表 提 前 60 分 钟 的 预测 结果 。 
2.4 模型 消融 实验 
此 外 ， 本 文 对 模型 GR-GCN 进行 了 消融 实验 (Ablation 
Experiment)， 操 作 方 法 类 似 于 控制 变量 法 ， 目 的 是 为 了 证 明 
模型 当中 的 各 个 子 模块 对 于 预测 能 力 的 提升 能 力 。 分 别 去 除 
卷 积 模块 (OurGC) 和 解码 右 模 块 (OurDe) 对 其 进行 分 析 。 
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在 PeMSD4 和 PEMSDS 数据 集 上 观察 两 种 变 体 模 型 和 模型 
GR-GCN 分 别 在 15 分 钟 和 60 分 钟 时 平均 绝对 误差 (MAE) 的 
情况 ， 结 果 如 图 11 所 示 。 


*— Ground Truth — GR-GCN(15min) —— GR-GCN(60min) 


Traffic Flow 


Time(hh:mm) 
图 9 模型 在 传感器 1 上 预测 情况 
Fig.9 The comparison of predictions on sensor 1 
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图 10 ”模型 在 传感器 2 上 预测 情况 


Fig. 10 The comparison of predictions on sensor 2 
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(a) PeMSD4 1H BRSCUS VAZSXJLG ^ (b) PeMSDS 消融 实验 误差 对 比 
图 11 消融 实验 误差 对 比 图 
Fig. 11 The MAE ofthe ablation experiments 
从 上 图 可 以 看 出 ， 在 模型 去 除 图 疮 积 网 络 的 情况 下 ， 无 
论 是 短期 (1Smin) 预 测 任务 还 是 长 期 (60min) 预 测 任务 , 预测 误 
差 都 有 着 明 显 的 增 大 。 这 再 次 说 明 ， 同 时 考虑 交通 数据 的 时 
闻 和 至 间 的 特征 比 仅仅 考虑 时 间 维 度 的 特征 会 更 有 利于 预测 。 
对 于 去 除 解码 器 模块 ， 改 用 全 连接 进行 单 步 预测 的 情况 ， 在 
短期 预测 任务 下 误差 与 本 文 所 提 模 型 没有 较 大 差距 ， 但 是 对 
于 长 期 预测 任务 差距 明显 ， 这 再 次 说 明 ， 使 用 能 够 进行 多 步 
预测 的 解码 匿 是 有 利于 长 期 预测 的 。 
综 上 所 述 ， 本 文 所 提 模 型 的 各 个 模块 不 仅 对 短期 预测 任 
务 有 较 好 的 提升 效果 ， 还 有 利于 降低 在 长 期 预测 任务 上 的 预 
illl ix 25 e 


3 RE 


本 文 针 对 现 有 的 交通 流 预 测 方法 未 能 有 效 的 结合 时 空 特 
征 以 及 大 部 分 使 用 全 连接 层 进行 单 步 预 测 的 问题 。 提 出 了 基 
于 编码 器 解码 器 结构 的 神经 网 络 模 型 。 该 模型 在 编码 器 部 分 
时 空 GCN 提取 相 邻 节点 交通 流量 的 空间 信息 ， 再 将 带 有 空 
间 信 息 的 节点 通过 GRU 提取 节点 中 的 时 序 信 息 ， 并 得 到 一 
个 包含 时 空 特征 的 隐藏 表示 。 最 后 通过 解码 器 依次 解码 出 每 
个 时 间 步 的 预测 信息 ， 得 出 预测 结果 。 最 终 在 两 个 真实 路 网 
数据 集 上 的 实验 结果 表明 ， 模 型 在 MAE 和 RMSE 两 个 指标 
值 下 基本 上 优 于 其 他 基线 算法 ， 可 以 有 效 的 对 交通 流量 进行 
预测 。 
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